header%20ipynb.png

Hands-On


Hands-On ini digunakan pada kegiatan Microcredential Associate Data Scientist 2021

Pertemuan 9


Pertemuan 9 (sembilan) pada Microcredential Associate Data Scientist 2021 menyampaikan materi mengenai Mengkonstruksi Data

Pada Tugas Mandiri Pertemuan 9

silakan Anda kerjakan Latihan 1 s/d 10. Output yang anda lihat merupakan panduan yang dapat Anda ikuti dalam penulisan code :)

Latihan (1)

Melakukan import library yang dibutuhkan

Latihan (2)

Menghitung nilai null pada dataset :

1. Load dataset Iris_Unclean
2. Tampilkan dataset
3. Hitung jumlah nilai null pada dataset

Latihan (3)

Melakukan handle missing value dengan Imputasi Mean:

 1. Load dataset Iris_Unclean
 2. Ambil 10 data teratas "SepalLengthCm", kemudian tampilkan
 3. Mengganti missing value Imputasi dengan mean, kemudian masukkan ke variable
 4. Tampilkan 10 data teratas "SepalLengthCm" setelah handle missing value dengan Imputasi mean()

Latihan (4)

Melakukan handle missing value dengan nilai suka-suka (Arbitrary):

 1. Load dataset Iris_Unclean
 2. Ambil 10 data teratas "SepalLengthCm", kemudian tampilkan
 3. Mengganti missing value dengan imputasi nilai suka-suka (Arbitrary), kemudian masukkan ke variable
 4. Tampilkan 10 data teratas "SepalLengthCm" setelah handle missing value dengan nilai suka-suka 

Latihan (5)

Melakukan handle missing value dengan frequent category / modus:

 1. Load dataset Iris_Unclean
 2. Ambil 10 data teratas "SepalLengthCm", kemudian tampilkan
 3. Mengganti missing value dengan frequent category / modus
 4. Tampilkan hasil imputasi "SepalLengthCm" setelah handle dengan frequent category / modus

Latihan (6)

Melakukan handle missing value dengan Imputasi Random Sample:

 1. Load dataset Iris_Unclean
 2. Tampilkan 10 data teratas
 3. Membuat imputer random sample dengan random state = 5
 4. Cocokan imputer ke data
 5. Ubah data dengan imputer masukkan ke dalam variable
 6. Tampilkan hasil imputasi data "SepalLengthCm"

Latihan (7)

Melakukan Winsorizing

1. Import library winsorize dari scipy
2. Load data Iris_AfterClean
3. Ambil 10 data teratas "SepalLengthCm", kemudian masukkan ke dalam variabel datan tampilkan
4. Winsorize data dengan batas nilai terendah 10% dan batas nilai tinggi 20%
5. Tampilkan hasil winsorize

Latihan (8)

Melakukan Trimming

1. Import library trima dari scopy
2. Load data Iris_AfterClean
3. Ambil 10 data teratas "SepalLengthCm", kemudian masukkan ke dalam variabel datan tampilkan
4. Trimming data dengan batas nilai terendah 2 dan batas nilai tinggi 5
5. Tampilkan hasil trimming

Latihan (9)

Melakukan Scaling: Normalisasi

1. Load data Iris_AfterClean 
2. Ambil 10 data teratas SepalLengthCm dan SepalWidthCm
3. Menghitung mean data
4. Menghitung max - min pada data
5. Menerapkan transformasi ke data
6. Tampilkan hasil scalling

Latihan (10)

Melakukan Scaling: Standardisasi

1. Load data Iris_AfterClean 
2. Ambil 10 data teratas SepalLengthCm dan SepalWidthCm
2. Import library StandardScaler dari sklearn
3. Membuat objek scaler
4. Sesuaikan scaler dengan data
5. Mengubah data 
6. Tampilkan hasil scalling dengan standarisasi